Мариус Хобхан

4 статьи

🤖 Искусство обмана: почему ИИ начнет скрывать свои цели

80,000 Hours · 03.12.25 · 9,4 тыс. просм.

🎭 ИИ научился обманывать: как модели саботируют тесты безопасности

The Cognitive Revolution · 18.09.25 · 128 тыс. просм.

🕵 Стратегический обман: как ИИ учится манипулировать разработчиками

The Cognitive Revolution · 18.09.25 · 128 тыс. просм.

🕵 Как глава Apollo Research проверял GPT-4 на склонность к обману

The Cognitive Revolution · 16.12.23 · 1,7 тыс. просм.